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摘要 : 在 利用 LAMOST 巡天 数据 进行 特殊 天 体 搜 寻 或 样本 构建 时 ， 以 及 在 处 理 
LAMOST 不 断 累 积 的 低 信 骂 比 光谱 时 ， 通 常 需要 耗费 科学 家 大 量 的 时 间 完 成 人 工 识 谱 。 针 
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对 这 样 的 问题 ， 我 们 设计 并 实现 了 一 套 专家 识 谱 平台 。 该 平台 是 集 光谱 可 视 化 、 光 谱 分 析 、 


多 波段 图 像 融 合 、 多 种 数据 挖 据 算法 等 功能 于 一 体 的 科学 与 科普 教研 平台 。 利 用 该 平台 ， 

天 文学 家 进行 天 体 搜 寻 、 样 本 构建 等 科学 研究 将 会 变 得 相对 容易 ; 通过 该 平台 ， 高 校 教师 
可 以 开展 各 种 有 天 文 特 色 的 教研 活动 ; 借助 群体 力量 ， 该 平台 将 能 逐步 消化 LAMOST 不 断 
积累 的 标注 为 “UNKNOWN” 的 未 知 光谱 数据 。 
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我 国 自主 研发 的 大 型 光谱 巡天 望远镜 LAMOST 自 2012 年 正式 巡天 以 来 ， 已 经 获取 了 
700 余 万 条 光谱 。 这 些 光 谱 为 科学 研究 提供 了 丰富 的 数据 基础 ， 科 学 家 们 已 经 利用 
LAMOST 数据 取得 了 一 系列 高 质量 的 研究 成 果 ， 发 表 学 术 文 章 论 文 近 百 篇 。LAMOST 为 
我 国 在 天 文学 领域 跻身 世界 先进 行列 做 出 了 重要 贡献 。 

从 科学 成 果 上 看 ，LAMOST 的 大 样本 数据 优势 吸引 了 众多 的 科学 家 ， 一 大 批 科学 成 果 
集中 在 特殊 天 体 的 搜寻 或 特殊 样本 的 构建 上 ， 比 如 ， 李 海宁 等 人 开展 的 贫 金 属 星 样本 的 搜 
寻 吊 ， 吴 学 兵 等 人 开展 的 类 星体 样本 构建 点， 霍 志 英 等 人 开展 的 M31/33 附近 类 星体 的 搜寻 
Bl, 任 娟 娟 等 人 开展 的 白 矮 一 主 序 双 星 的 搜寻 外， 赵 景 昆 等 人 馈 、 张 悦 扬 等 人 ，Rebassa- 
Mansergas 等 人 开展 的 DA 型 白矮星 样本 的 识别 及 相关 科学 研究 ;修文 等 人 开展 的 Am 星 的 
样本 构建 站 ， 司 建 敏 等 人 、 纪 伟 等 人 开展 的 碳 星 候选 体 搜寻 ; 杨帆 等 人 开展 的 RR ASB 
变星 及 氧 的 巴尔 莫 线 系 分 布 统 计 ; 石 志 诸 等 人 开展 的 双 峰 罕 发 射线 星系 及 AGNs 样本 的 搜 
寻 ; 杨 海 峰 等 人 开展 的 E+A 型 星系 搜寻 ; 林 建 峥 等 人 开展 的 Be 星 搜寻 ; 沈 世 银 等 人 开展 
的 星系 对 样本 证 认 外 等 等 。LAMOST 的 样本 太 大 ， 启 动 这 些 研究 工作 往往 需要 首先 设 定 一 
套 复杂 的 判别 条 件 并 依靠 各 种 数据 挖掘 算法 或 统计 方法 挑选 出 目标 候选 体 ， 然 后 基于 人 工 
识 谱 和 多 波段 测 光 信息 综合 来 证 认 候选 体 。 机 器 算 选 得 到 的 候选 体 依然 动 辑 数 千 、 数 万 甚 
至 数 十 万 ， 人 工 判别 工作 量 巨大 。 

从 数据 质量 分 布 上 看 ， LAMOST 发 布 的 700 多 万 条 光谱 中 (以 LAMOST DR4 为 例 )， 
如 图 1 所 示 ， 除 了 600 万 条 较 亮 的 恒星 能 被 pipeline 自动 处 理 给 出 结果 外 ，11.8 万 条 星系 和 
4 万 多 条 类 星体 ， 由 于 信 噪 比 低 ，pipeline 自动 处 理 效果 不 好 ， 有 很 大 一 部 分 纯粹 是 靠 人 工 
一 条 条 识 谱 确 定 的 。 还 需要 重点 关注 的 是 ，5 年 巡天 观测 已 经 积累 了 62 万 余 条 标注 为 
“UNKNOWN”( 未 知 光 谱 ) 的 待 识别 光谱 ， 这 些 天 体 大 多 数 是 因为 自身 太 暗 获取 的 光谱 信 品 
比 太 低 ， 传 统 的 算法 无 法 处 理 ， 也 可 能 有 极 少 数 奇 异 的 天 体 ， 由 于 谱 型 太 奇怪 ， 传 统 的 算 
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法 无 法 识别 ， 如 毛 晓 燕 等 人 提出 了 基于 加 权 滤 波 的 低 信 噪 比 LAMOST 光纤 光谱 信号 降 噪 品 
相关 算法 。 随 着 巡天 观测 的 不 断 深 入 ， 这 些 未 知 光谱 会 越 积累 越 多 。 如 何 处 理 这 些 低 质量 
的 数据 ， 是 现代 统计 学 和 数据 挖掘 技术 面临 的 一 个 挑战 。 


图 1. LAMOST DR4 数据 分 布 示意 图 ， 未 知 光谱 记录 数 已 超过 了 62 万 条 
Fig.1 LAMOST DR4 with more than 620 thousand UNKNOWN objects 


围绕 LAMOST 天 文 光 谱 的 处 理 ， 在 LAMOST 项 目 组 的 带动 下 ， 一 批 数 据 挖掘 专家 团 
队 纷 纷 加 入 了 光谱 处 理 的 研究 课题 中 ， 并 取得 了 显著 的 成 果 。 然 而 ， 即 使 数据 挖掘 专家 能 
对 这 些 低 信 噪 比 光 谱 给 出 类 别 或 参数 估算 值 ， 天 文学 家 依然 会 抱 着 质疑 的 态度 放弃 使 用 这 
些 数据 。 这 些 光 谱 只 有 经 过 人 工 识 别 后 ， 才 能 提升 其 使 用 可 信和 度 。 但 是 如 此 巨 量 的 数据 仅 
靠 少数 专家 利用 有 限 的 时 间 、 有 限 的 精力 完成 人 工 处 理 是 不 可 能 的 。 

为 了 改善 这 种 状况 ， 我 们 提出 构建 基于 数据 挖掘 的 专家 识 谱 平 台 ， 利 用 先进 的 IT 技术 
及 数据 挖掘 技术 整合 常见 算法 ， 研 发 一 套 集 光 谱 数据 管理 、 可 视 化 与 分 析 为 一 体 的 科学 与 
科普 教研 专家 识 谱系 统 。 


之 .目标 分 析 及 结构 设计 


按照 天 文学 家 及 天 文教 育 工作 者 的 设想 ， 专 家 识 谱 乎 台 应 满足 以 下 四 个 方面 要 求 : 

(1) 集成 多 种 可 视 化 与 分 析 工 具 、 数 据 挖掘 算法 ， 使 天 文学 家 甚至 普通 学 生 搜 寻 特 丈 
天 体 、 作 出 新 发 现 变 得 更 加 容易 ; 

(2) 围绕 低 信 噪 比 光谱 ， 开 展 数据 挖掘 算法 研究 ， 利 用 机 器 尽 可 能 多 地 挖掘 有 价值 信 
息 ， 减 少 人 工 识 谱 难度 ; 

(3) 支持 团队 协作 工作 模式 ， 辅 助 天 文教 育 工作 者 在 天 文教 学 过 程 中 开展 特殊 天 体 搜 
寻 、 人 工 识 谱 等 教研 活动 ， 实 现 有 天 文 特 色 的 研究 型 素质 教育 ; 

(4) 能 像 国际 星系 动物 园 (GalaxyZoo) Raddick J, Lintott C J, Schawinski 
a K, et al. Galaxy Zoo: an experiment in public science 
€ participation[J]. Advances in Atmospheric Sciences, 2007, 39: 892. mi 
目 一 样 ， 通 过 发 动 公众 力量 ， 完 成 需要 大 量 人 工 干 预 的 天 文 光 谱 数据 的 处 理工 作 ， 逐 步 消 
化 LAMOST 巡天 不 断 产 出 的 未 知 光 谱 。 


图 2. 专家 识 谱 平台 结构 示意 图 
Fig.2 The architecture of expert platform for spectral inspection 

从 上 述 业务 需求 出 发 ， 我 们 设计 了 一 套 专 家 识 谱 乎 台 。 如 图 2 所 示 ， 该 平台 主要 包括 
三 个 组 成 部 分 : 数据 挖掘 层 (Data-mining Layer) 、 数 据 节 点 层 (Data Node Layer)、 专 家 识 
谱 层 (Expert Layer). 

(1) 数据 挖掘 层 : 针对 LAMOST 低 信 噪 比 光 谱 ， 开 展 各 种 数据 挖掘 算法 的 研究 ， 并 
利用 这 些 算 法 最 大 限度 地 挖掘 LAMOST 低 信 噪 比 光 谱 的 科学 价值 。 主 要 涉及 LAMOST 低 
信 品 比 光 谱 的 分 类 问题 、 恒 星光 谱 的 特征 提取 问题 〈 给 出 部 分 恒星 的 大 气 物 理 参数 的 参考 
值 ) 、 低 信 噪 比 星系 及 类 星体 的 红 移 测量 问题 。 数 据 挖掘 成 果 上 传 至 数据 节点 层 ， 由 服务 
器 管理 。 
(2) 数据 节点 层 : 管理 用 户 上 传 的 数据 。 从 文件 类 型 上 看 ， 主 要 包括 用 于 存储 元 数据 
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的 数据 库 文件 和 存储 光谱 数据 的 fits 文件 ， 从 数据 访问 权限 上 看 ， 包 括 对 所 有 注册 用 户 可 
见 的 公共 数据 (PublicDB ) 、 组 内 成 员 可 见 的 组 内 数据 (GroupDB) ， 以 及 用 户 私 有 的 个 
人 数据 (MyDB ) 三 个 数据 层次 。 该 层 的 数据 封装 后 通过 ODBC EÈ JDBC 与 专家 层 交 互 。 

(3) 专家 识 谱 层 ， 建立 多 平台 的 客户 端 ， 比 如 Web 客户 端 、 桌 面 应 用 程序 端 、 手 机 
APP 等 实现 对 光谱 数据 的 在 线 可 视 化 与 分 析 。 可 视 化 主要 指 星 表 数 据 的 可 视 化 、fits 光谱 医 
像 的 实时 交互 可 视 化 、 对 应 的 多 波段 数据 融合 可 视 化 ， 数 据 分 析 主 要 包括 红 移 或 视 向 速度 
的 实时 计算 、 光 谱 的 便捷 式 模版 匹配 、 谱 线 的 标示 、 数 据 查 询 以 及 用 户 Feedback 等 功能 。 

数据 挖掘 层 接口 相对 松散 ， 数 据 挖掘 的 算法 允许 用 户 围绕 具体 的 科学 目标 自己 定制 ， 
只 要 求 输出 结果 为 平台 兼容 的 数据 格式 ， 平 台 将 会 逐步 集成 多 种 常见 数据 挖掘 算法 ， 璧 如， 
于 测 光 红 移 、 光 谱 分 类 、 光 谱 特征 提取 等 特定 需求 的 神经 网 络 、 支 持 向 量 机 、 主 成 分 分 
析 等 算法 。 这 部 分 体现 平台 的 高 级 功能 ， 目 前 只 是 预 留 了 大 部 分 接口 ， 后 期 根据 用 户 需求 
逐步 实现 。 本 文 不 做 重点 描述 。 

数据 节点 层 和 专家 识 谱 层 耦合 性 较 强 ， 我 们 选择 在 轻 量 级 PEE Spring 框架 下 实现 ， 其 
中 数据 库 选 用 天 文 上 较为 常用 的 MySQL 数据 库 ， 利 用 ORM 插件 实现 星 表 数 据 的 动态 管理 ， 
光谱 数据 分 析 与 可 视 化 界面 通过 Javascript、 图 表 处 理 显示 组 件 、Mallet 小 波 降 噪 等 插件 来 


实现 。 数 据 节点 层 和 专家 识 谱 层 是 识 谱 平台 的 基本 模块 ， 本 文 将 重点 讲述 。 
CD 
LO 3. 功能 分 析 与 实现 
© 本 节 主 要 讲述 数据 节点 层 和 专家 识 谱 层 的 功能 分 解 与 实现 ， 其 中 数据 节点 层 的 数据 管 
LO 里 ， 主 要 利用 数据 库 技术 和 网 络 技术 来 实现 ， 专 家 识 谱 层 中 一 维 光谱 数据 的 在 线 可 视 化 与 
分 析 ， 主 要 通过 Java 图 表 处 理 相关 技术 来 实现 。 专 家 识 谱 平台 目前 主要 设计 了 八 项 功能 : 
] 户 管理 、 数 据 访问 权限 管理 、 数 据 上 传 、 数 据 检索 与 下 载 、 多 波段 信息 融合 、 一 维 光谱 
数据 的 可 视 化 与 数据 分 析 、 专 家 信息 反馈 与 知识 库 管理 、 虚 拟 天 文 台 服 务 等 。 
3.1. Aree 
平台 系统 完全 模拟 真实 科学 研究 团队 的 协作 模式 ， 将 用 户 划分 为 四 个 层次 ， 系统 管理 
员 、 群 管理 员 、 专 家 用 户 、 匿 名 用 户 。 
(1) 匿名 用 户 (Anonymous) : 浏览 开放 信息 ， 了 解 或 学 习 相关 知识 ， 比 如 学 习 


(Learning) 模块 、FAQ 以 及 公开 的 数据 ， 没 有 导入 数据 权限 。 
(2) 专家 用 户 (Expert): 可 以 上 传 自己 的 私有 数据 〈 包 括 光 谱 数 据 和 星 表 数据 ) ， 
利用 可 视 化 工具 识别 、 标 识 光 谱 ， 将 处 理 结果 写 入 数据 库 。 
(3) 群 管理 员 (GroupAdmin) : 群 管理 员 拥 有 创建 新 用 户 、 添 加 组 员 和 删除 组 员 的 
权限 ， 群 管理 员 自 动 成 为 新 组 成 员 。 
(4) 系统 管理 员 (SystemAdmin) : 除 具 有 群 管理 员 、 专 家 用 户 权限 外 ， 系 统管 理 员 
可 以 创建 群 组 并 决定 某 用 户 是 群 管理 员 还 是 普通 用 户 ， 同 时 还 负责 为 用 户 分 配 最 大 可 用 存 
储 空 间 。 


3.2. 数据 访问 权限 管理 
根据 科学 研究 的 实际 需求 ， 平 台 将 数据 划分 为 三 个 层次 : 个 人 数据 (MyDB) 、 群 组 
数据 (GroupDB) 、 公 共 数 据 (PublicDB ) ， 如 图 3 所 示 。 


图 3. 平台 的 三 类 数据 库 MyDB、GroupDB 以 及 PublicDB 


ChinaxX iv (ERAT 


Fig.3 The three kinds of databases in the platform: MyDB, GroupDB and PublicDB 


(1) MyDB: 用 户 自己 上 传 的 数据 表 ， 该 数据 为 私有 数据 ， 仅 上 传 者 自己 可 见 。 

(2) GroupDB: 群 内 共享 的 数据 表 ， 该 数据 由 数据 上 传 者 提交 群 内 共享 申请 ， 由 群 管 
1 核 决定 数据 是 否 对 群 内 所 有 成 员 可 见 。 

(3) PublicDB: 可 被 所 有 注册 用 户 访问 的 数据 表 ， 该 数据 由 群 管理 员 提 交 申请 ， 由 系 
统管 理 员 审核 决定 数据 是 否 让 所 有 用 户 可 见 。 


pail 


3.3. ”数据 上 伟 
平台 的 数据 类 型 主要 分 为 两 类 星 表 数 据 和 一 维 光谱 数据 。 其 数据 上 传 界面 如 图 4 所 


图 4. CSV 星 表 数 据 与 FITS 文件 的 上 传 
Fig.4 The upload UI of CSV catalog and FITS spectrum files 

C1) 星 表 数 据 : 系统 主要 支持 CSV 文件 格式 。 用 户 上 传 CSV 文件 数据 入 库 ， 系 统 在 
MyDB 中 生成 对 应 数据 表 。CSYV 文件 的 第 一 行 被 自动 识别 为 数据 表 的 字段 名 ，CSV 文件 名 
默认 为 数据 表 名 称 〈 用 户 也 可 以 自己 指定 表 名 称 ) 。 

(2) 光谱 数据 : 系统 主要 支持 FITS 文件 。 主 要 通过 两 种 方式 获取 FITS 文件 : 像 
LAMOST、SDSS 这 样 的 大 型 巡天 ， 通 常 都 已 经 将 数据 发 布 在 网 上 ， 用 户 只 需要 在 上 传 的 
星 表 数 据 中 提供 mjd、plateID、fiberID 等 唯一 标识 光谱 的 信息 ， 系 统 会 自动 为 用 户 定位 相 
应 的 FITS 文件 ， 像 兴隆 “2.16”、 丽 江 “2.4” 等 望远镜 产 出 的 小 样本 光谱 数据 ， 用 户 需 要 自 
己 将 FITS 文件 打包 上 传 至 平台 。 


3.4. 数据 检索 和 下 载 

这 里 的 数据 检索 有 两 层 含义。 首先 是 星 表 文件 的 检索 ， 其 次 是 所 选择 星 表 的 内 容 和 用 
户 feedbacks 记录 的 检索 。 如 图 5 所 示 ， 如 果 管 理 的 星 表 较 多 ， 可 能 需要 匹配 表 名 、 关 键 字 、 
数据 源 等 条 件 来 检索 出 用 户 想 要 的 星 表 。 


5. 星 表 文件 的 检索 
Fig.5 The query UI of Catalogs 


用 户 可 能 不 熟悉 数据 库 查 询 语言 。 为 此 ， 系 统 提 供 了 动态 生成 常见 检索 条 件 表达 式 及 
其 按照 “与 ”、“ 或 ”关系 组 合 形成 复杂 树 形 逻辑 结构 检索 条 件 的 功能 ， 如 图 6 所 示 。 对 
查询 结果 ， 全 选 或 部 分 选中 左 侧 的 复 选 框 ， 点 击 右 侧 的 下 载 “Download" 按 钮 ， 可 以 打包 
下 载 数据 ， 如 图 7 所 示 。 


3.5. 。 多 波段 信息 融合 

在 科学 研究 过 程 中 ， 科 学 家 除了 查看 天 体 的 某 条 光谱 数据 外 ， 通 常 还 需要 综合 多 波段 
的 图 像 或 光谱 信息 ， 以 便 准 确 判 断 天 体 类 型 或 测量 天 体 的 物理 参数 。 为 此 ， 平 台 提供 接口 
融合 SDSS、2MASS 等 巡天 望远镜 的 测 光 图 像 数 据 。 查 询 界 面 如 图 8 所 示 ， 碍 询 结果 如 图 
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9 所 示 。 


图 8. 多 波段 数据 融合 界 画 
Fig. 8 The UI of Multi-band combinations 


图 9. 多 波段 查询 示例 : 利用 SDSS HY SkyServer LA Szalay A S, Gray J, Thakar A R, et 
al. 


The SDSS skyserver: public access to the sloan digital sky server 
data[C]// Proceedings of the 2002 ACM SIGMOD international conference 
on Management of data. ， 并 根据 传 入 的 RA 和 DEC 自动 定位 测 光 图 像 


Fig.9 An example of Multi-band query: the SDSS Skyserver automatically targets the photometric image with the 
input parameters, i.e. RA and DEC 


3.6. 光谱 数据 可 视 化 与 数据 分 析 

该 部 分 包括 光谱 的 局 部 缩放 、 谱 线 标注 、 等 值 宽度 测量 、 小 波 滤波 降 噪 、170 多 种 光 
谱 的 模版 匹配 、 红 移 自动 测量 、 图 像 保 存 、 打 印 等 基本 操作 。 人 机 交互 操作 完全 通过 浏览 
器 来 实现 光谱 可 视 化， 不 需要 额外 安装 任何 插件 。 显 示 界面 如 图 10 所 示 。 

通常 利用 批 处 理 程序 pipeline 对 巡天 获取 的 光谱 进行 自动 模版 匹配 ， 基 于 最 佳 匹配 进 
行 类 型 判断 和 参数 测量 。 然 而 ，pipeline 对 低 信 噪 比 光 谱 的 处 理 效果 不 好 ， 因 此 LAMOST 
产 出 了 相当 一 部 分 未 知 光谱 ， 这 些 光 谱 不 应 该 被 遗忘 。 
平台 提供 全 面 的 恒星 、 星 系 以 及 类 星体 模版 ， 用 以 帮助 用 户 实现 人 机 交互 式 模版 匹配 。 
j 户 挑选 模版 ， 通 过 蒙 音 技术 吻 除 光谱 上 不 可 靠 部 分 ， 完 成 粗略 匹配 后 ， 系 统 将 自动 寻求 
最 佳 呈 配 位 置 ， 并 自动 计算 天 体 物 理 参数 〈 红 移 或 视 向 速度 等 ) 。 


图 10. FITS 光谱 的 可 视 化 与 数据 分 析 ， 蓝 色 曲 线 为 LAMOST 观测 光谱 ， 黑 色 曲 线 为 QSO 光谱 模版 ， 红 


S 


虚线 为 Ha 发 射线 ， 该 发 射线 及 整个 模版 光谱 可 跟随 鼠标 自由 移动 ， 以 寻求 模版 与 观测 光谱 的 最 佳 匹配 
Fig.10 The display and analysis of a fits spectrum, the blue curve is the LAMOST observed spectrum, the black 


[R 


curve is a QSO spectrum template, the red dashed line marks the location of Ha emission line, which and the 


whole template are movable along with the cursor 


3.7. 专家 信息 反馈 与 知识 库 


图 11. 光 谱 信息 用 户 反 馈 界 和 
Fig.11 The UI of feedback from users 
对 于 每 条 光谱 ， 专 家 可 以 通过 光谱 可 视 化 与 分 析 模 块 完成 人 工 处 理 ， 并 将 处 理 结果 反 


馈 至 数据 库 。GroupDB 和 PublicDB 中 的 每 一 条 光谱 ， 可 能 会 被 多 个 用 户 分 析 处 理 ， 平 台 将 
记录 每 位 用 户 的 分 析 结 果 ， 并 形成 列表 ， 供 科学 家 参考 。 经 过 长 时 间 运 行 后 ， 系 统 将 收集 
形成 一 系列 专家 知识 库 。 


3.8. 虚拟 天 文 台 (V0) 服务 
司 际 虚 拟 天 文 台 联盟 一 直 致力 于 将 全 球 范围 内 的 研究 资源 无 颖 透明 地 连接 在 一 起 ， 形 


成 数据 密集 型 网 络 化 天 文 研究 平台 。 经 过 十 几 年 的 发 展 ， 已 经 拥有 了 丰富 的 数据 资源 、 服 
务 资 源 ， 包 括 由 从 高 能 伽 玛 射线 一 直到 射电 的 全 波段 数据 信息 ， 并 且 基 于 这 些 数 据 ， 研 发 
出 了 很 多 优秀 的 软件 工具 ， 比 如 Topeat?, AladinBonnarel F, Fernique P, 

Bienaymé 0, et al. The ALADIN interactive sky atlas: a reference tool 


for identification of astronomical sources[J]. Astronomy & 
Astrophysics Supplement , 2000, 143: 33-40.. NEDHelou G, Madore B F 
Bicay M D, et al. The NASA/IPAC extragalactic database[C]// 
Proceedings on the 6th Workshop of the Advanced School of Astronomy 
of the Ettore Majorana Centre. 1991: 89-106. . SkyServerSzalay A S, Gray 
J, Thakar A R, et al. The SDSS skyserver: public access to the sloan 
digital sky server data[C]// Proceedings of the 2002 ACM SIGMOD 
international conference on Management of data. 、SciServer 等 。 我 们 的 平台 


将 通过 后 台 脚 本 ， 实 现 与 这 些 服务 或 数据 的 对 接 。 


.应 用 案例 


本 节 以 几 节 高 校 天 文选 修 课 的 主要 教学 环节 设计 为 例 来 展示 专家 识 谱 平 台 的 使 用 功效 : 

(1) 课 前 ， 我 们 将 任 娟 娟 等 人 ?挑选 的 318 颗 白 矮 一 主 序 双星 样本 与 一 些 普 通 恒星 的 
样本 数据 混合 并 导入 平台 ， 同 时 按照 学 号 为 学 生 批量 注册 账号 ， 并 设 为 同一 Group 成 员 。 

(2) 在 学 生 初 步 了 解 《 恒 星 的 一 生 》 这 一 章节 后 ， 教 师 又 专门 介绍 了 一 些 奇特 的 恒星 
系统 及 其 科学 意义 ， 在 平台 上 给 学 生 演 示 了 各 种 白 矮 主 序 一 双星 的 测 光 图 像 、 光 谱 特 征 ， 
最 后 分 组 交叉 分 发 “ 白 矮 一 主 序 双星 搜寻 ”任务 。 

(3) 在 接 下 来 的 第 二 课时 ， ee 
动 “ 禁 道 增 七 ”， 用 普通 的 科普 望远镜 看 它 是 一 黄 一 蓝 的 双星 ， 该 双星 与 学 生 要 搜寻 的 白 
活 _ 主 序 双星 很 像 ， 但 存在 一些 本 质 上 的 区 别 ， 在 高 倍 望远镜 下 ， 黄 色 的 再 道 增 七 A 本 身 
还 是 一 个 联 星 ， 蓝 色 的 再 道 增 七 B 是 一 颗 快 速 自转 的 Be 星 。 

(4) 要 求 每 个 学 生 至 少 人 工 识 谱 50 条 不 同 的 光谱 ， 并 在 一 个 月 之 后 提交 一 份 简单 的 研 
究 报 告 。 


12. 白 矮 一 主 序 双星 候选 体 的 测 光 照片 ( 左 ) 及 LAMOST 拍摄 的 光谱 图 像 〈 右 ) 
Fig.12 The photometry image of white dwarf-main sequence binary star candidates (left) and their spectrum of 


LAMOST (right) 


图 12. 中 的 两 幅 图 像 都 截取 于 专家 识 谱 测 试 平台 ， 在 我 们 的 平台 上 ， 学 生 仅 需 要 三 到 五 
URE TEE PIRENA E E E AR E E AAA 否 属于 
双星 候选 体 ， 如 果 要 进一步 确定 ， 需 要 分 析 右 边 的 光谱 图 像 ， 光 谱 图 像 是 系统 直接 读 取 
FITS 文件 实时 动态 展示 的 ， 支 持 互动 式 操 作 。 右 边 蓝 色 曲 线 是 LAMOST 的 实测 光谱 ， 经 
过 小 波 滤波 处 理 〈 仅 需 一 次 鼠标 点 击 ) ， 消 除了 大 部 分 噪声 信号 ， 使 光谱 变 得 光滑 ， 而 黑 
色 曲 线 是 经 过 两 次 鼠标 点 击 后 从 系统 调 取 的 白矮星 光谱 模版 。 通 过 蓝 色 和 黑色 曲线 对 比 ， 
学 生 不 难 发 现 ， 蓝 色 曲 线 在 波长 大 约 6500 埃 之 后 的 红 端 ， 与 模版 的 谱 型 匹配 的 不 好 ， 这 主 
要 是 因为 该 光谱 的 红 端 部 分 由 其 伴星 ( 左 图 偏 红 的 矮星 〉 贡献 ， 光 谱 的 红 端 部 分 可 以 用 矮 
星 的 模版 很 好 地 匹配 。 
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识 谱 平 台 记录 每 位 同学 的 识 谱 结果 ， 教 师 (Group 管理 员 ) 很 容易 检索 出 那些 被 多 个 
学 生 同 时 确认 为 白 矮 一 主 序 双星 的 记录 。 被 不 同学 生 确认 的 次 数 越 多 ， 该 天 体 属 于 白 矮 一 
主 序 双星 的 概率 就 越 大 。 通 过 这 样 的 研究 型 教学 活动 ， 我 们 发 现 学 生 对 浩瀚 宇宙 中 那些 


A 
HR 7S SLE OE EA As ESE RO, OS OPIN A et, Aaa 
生 都 能 积极 参与 ， 共 同 努 力 将 绝 大 多 数 的 白 矮 一 主 序 双 星 找 出 来 。 教 师 还 可 以 将 那些 非常 


疑似 的 白 矮 一 主 序 双 星 提取 出 来 ， 分 配给 物理 学 院 的 学 生 或 对 天 文学 真正 感 兴趣 的 学 生 ， 
利用 学 校 每 年 开展 的 大 学 生 科技 立项 活动 或 本 科 毕 业 设 计 的 机 会 ， 让 学 生 进 一 步 研究 哪些 
双星 属于 共 包 层 后 双星 候选 体 。 
除了 上 述 的 应 用 案例 外 ， 目 前 该 平台 还 可 以 很 好 地 应 用 于 类 星体 的 人 工 搜 寻 ( 辟 如 图 
10 所 示 ) 、 星 系 对 搜寻 、 碳 星 搜寻 等 科学 目标 上 ， 既 可 通过 个 人 方式 来 完成 ， 也 可 支持 团 
队 协 助 模式 进行 ， 由 于 篇 幅 限 制 ， 这 里 就 不 再 费 述 。 


5. #45Re 


本 文 概述 从 LAMOST 光谱 数据 处 理 的 需求 出 发 ， 基 于 先进 的 IT 技术 研发 一 套 专 家 识 
谱 平 台 , 以 网 站 形式 对 外 发 布 服务 ， 帮 助 科学 家 提高 人 工 识 谱 效率 ， 帮 助 天 文教 育 工 作者 丰 
富 教学 形式 ， 帮 助 LAMOST 消化 未 知 光谱 。 
目前 该 乎 台 还 需要 继续 集成 多 种 数据 挖掘 算法 ， 我 们 正 致力 与 国际 知名 的 一 维 光 谱 可 
视 化 软件 SPLAT-VOSkoda P, Draper P W, Neves MC, et al. Spectroscopic 
analysis in the virtual observatory environment with SPLAT-VO[J]. 
Astronomy and Computing, 2014 , 7-8 : 108-120. 的 作者 合作 ， 使 SPLAT-VO 成 
为 专家 识 谱 平 台 的 主要 客户 端 之 一 。 和 希望 经 过 不 断 地 完善 ， 使 该 平台 成 为 我 国 大 科学 工程 
LAMOST 不 可 或 缺 的 光谱 数据 处 理 平 台 ， 并 使 之 成 为 天 文 光 谱 科 普 教育 的 首选 平台 。 
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Expert Platform for the Spectral Inspection 
Lei Guohong', Xu Yang’, Niu Chenhui””, Tian Haijun', Zhang Yanxia’, Cui Chenzhou’, 
Zhao Yongheng’ 

(1 . China Three Gorges University, Yichang, 443002, China; 2. National Astronomical Observatories, Chinese 
Academy of Sciences, Beijing 100012, China ; 3. Central China Normal University, Wuhan, 430079, China ) 
Abstract: An expert platform for spectral inspection is designed and implemented for the 

LAMOST survey in this paper. The platform is useful for 1) searching for objects with particular 
spectra; and 2) identifying accumulating spectra with low signal-to-noise ratio. It is a 
comprehensive science- and teaching-aimed platform, which has the capability of spectral 
visualization, analysis, multi-band image matching, etc. Based on this platform, astronomers can 
build the samples with particular spectrum easily, and teachers can carry out a variety of 
spectrum-based teaching and research activities. Finally, the accumulating number of LAMOST 


UNKNOWN objects can be gradually minimized with the help of world-wide astronomers using 
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this platform. 
Key words: LAMOST; Visual Inspection; DATA Mining; Astronomical teaching 
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